Détection de locuteurs dans les séries TV
نویسندگان
چکیده
RÉSUMÉ. La segmentation de flux audio en locuteurs apparaît particulièrement délicate lorsqu’elle est appliquée à des films de fiction, où de nombreux personnages parlent dans des conditions acoustiques variables (musique de fond, bruitages, fluctuations dans l’intonation...). Au-delà d’une telle variabilité acoustique, ce type de films exhibe cependant de la régularité sur le plan visuel, particulièrement dans les passages dialogués. Nous introduisons dans ce papier une méthode en deux temps pour procéder à la segmentation en locuteurs d’épisodes de séries TV : un premier regroupement en locuteurs est effectué localement, dans les limites de scènes visuellement identifiées comme des dialogues ; les locuteurs conjecturés sont ensuite comparés lors d’une deuxième phase de regroupement afin de détecter les locuteurs récurrents : cette deuxième étape de regroupement a lieu sous la contrainte que les différents locuteurs impliqués dans un même dialogue soient assignés à des groupes distincts. Les performances obtenues par notre approche sont comparées à celles qu’on obtient en appliquant aux mêmes données des outils standards de segmentation en locuteurs.
منابع مشابه
Une approche de classification non supervisée basée sur la détection de singularités et la corrélation de séries temporelles pour la recherche d'états : application à un bioprocédé fed-batch
Résumé. Nous proposons dans cet article une méthode de clustering qui combine l’analyse dynamique et l’analyse statistique pour caractériser des états. Il s’agit d’une méthode de fouille de données qui travaille sur des ensembles de séries temporelles pour détecter des états; ces états représentent les informations les plus significatives du système. L’objectif de cette méthode non supervisée e...
متن کاملSegmentation en locuteurs d'un document audio
R esum e: Dans cet article, nous abordons le probl eme de la segmentation en locuteurs. Le but est d'obtenir des segments de locuteurs homog enes, c'esta-dire ne contenant les paroles que d'un seul et même locuteur. Ces segments doivent être les plus longs possible. Dans notre etude, nous faisons les hypoth eses qu'aucune connaissance a priori sur les locuteurs n'est disponible et que les perso...
متن کاملDetection of change in river flow using phase randomization
Detection of nonstationarity in series of flow records is of vast scientific and practical significance. In order to develop guidance as to the choice of an appropriate test, among the many candidates, one has recourse to analysis of a controlled trend artificially introduced to generated data mimicking river flow observations. Raw series of good quality flow data were normalized and de-seasona...
متن کاملInvestigation of trend in hydrological time series of the Evinos River basin
This paper presents an investigation of trend in historic hydrological time series of areal annual precipitation on and mean annual runoff from the basin of the Evinos River in western Greece. Using different tests for randomness, a statistically significant long lasting decreasing trend was found in the precipitation record, whereas an also significant fluctuating "local" trend was detected in...
متن کاملNouvelle approche pour le regroupement des locuteurs dans des émissions radiophoniques et télévisuelles (New approach for speaker clustering of broadcast news) [in French]
RÉSUMÉ Dans cet article, nous proposons un nouveau modèle de regroupement de locuteurs pour la tâche de segmentation et de regroupement de locuteurs. Un des problèmes majeur rencontré dans le regroupement des locuteurs est que les algorithmes d’agglomération hiérarchique utilisés ne garantissent pas de donner une solution optimale. Nous proposons d’exprimer le problème de regroupement des locut...
متن کامل